IA023
Introducción a la programación con Triton
Configuración del entorno e identificación de cuellos de botella de GPU
Objetivos de aprendizaje
- Configurar y verificar un entorno de desarrollo de GPU listo para producción utilizando CUDA y ROCm.
- Ejecutar análisis de perfilado a nivel del sistema para mapear cronogramas de ejecución de kernels y utilización de recursos.
- Distinguir entre kernels limitados por cálculo y kernels limitados por memoria utilizando métricas y modelos de techo (roofline).
- Diagnosticar y reducir la sobrecarga de transferencia de datos de PCIe y la latencia entre el host y el dispositivo.